بررسی و بهبود روش های تشخیص هرزنوشته وب

پایان نامه
چکیده

هرزنویسی وب، فعالیت های افراد برای گمراه کردن موتور های جست و جو در رتبه بندی صفحات، بیشتر از آن چه که استحقاق دارند، می باشد. هرزنویسان از تکنیک های مختلفی برای بالا بردن رتبه صفحه خود بهره می برند. روش های مختلفی برای تشخیص هرزنویسی پیشنهاد شده است. پیش نیاز اکثر این روش ها این است که تعداد زیادی صفحه وب دارای برچسب هرزنوشته یا غیر هرزنوشته موجود باشد. استخراج داده از وب کار سختی نیست ولی بررسی و برچسب زنی این داده ها کاری بسیار زمان بر و خطادار است. در این پژوهش سعی می شود با پیشنهاد روش جدیدی این مشکل حل شود. پیشنهاد این پژوهش، استفاده از یادگیری نیمه نظارتی به جای برچسب زنی می باشد. در این روش، از تعداد بسیار کمی از داده های دارای برچسب و تعداد زیادی داده بدون برچسب برای برچسب زنی استفاده می شود. الگوریتم مورد استفاده در این روش، الگوریتم em با دسته بندی بیزین ساده می باشد. ارزیابی روی داده های webspam-uk2007 انجام می شود. آزمایشات نشان می دهند که این روش، نه تنها مشکل زمانی برچسب زنی را حل می کند، بلکه کارایی و دقت بالایی در تعیین برچسب داده ها دارد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهبود تشخیص درخواست های آتی کاربران با کاوش استفاده وب

شبکه ی جهانی وب و اطلاعات موجود در آن منبع مناسبی برای استفاده ی مردم در زمینه های مختلف می باشد. کاوش اطلاعات مورد استفاده کاربران می تواند منجر به شناسایی علایق آن ها و در نتیجه شناسایی الگوی پیمایشی کاربران شود. به کمک وب کاوی می توان این الگوها را به صورت خودکار شناسایی کرد. یکی از منابع مورد استفاده برای وب کاوی فایل های لاگ ذخیره شده در سرویس دهندگان وب می باشد. کاوش بر روی این داده، کارب...

روش های ارزیابی کیفیت وب سایت : روش های وب کیو ای ام و نمایه ارزیاب وب

مقدمه: امروزه وب یکی از مهم ترین ابزارهایی است که افراد بی شماری از آن به مثابه اصلی ترین ابزار برای دسترسی به اطلاعات استفاده می کنند. شبکه جهانی وب نقش مهمی در حوزه های کاربردی مختلف همچون تجارت، آموزش، صنعت وسرگرمی ایفا می کند. وب سایت ها نقش اساسی در اشاعه اطلاعات بر عهده دارند. روش های ارزیابی وب سایت ها به منظور شناخت دقیق تر و کنترل محتواهای تولید شده بر روی وب سایت ها  مورد استفاده قرار...

متن کامل

بهبود سیستم تشخیص کاربران بدرفتار وب از طریق کاوش در logهای وب سرور

ربات های وب به عنوان کاربران وب سایت ها و سرویس دهنده های وب سرتاسر شبکه ی جهانی وب را جهت اهداف گوناگونی پیمایش می کنند. این کاربران غیر از عملیات مفید مانند اندیس گذاری و راحت تر کردن عملیات جستجو، می توانند آزاردهنده و تهدیدکننده نیز باشند. تهدیداتی مانند جعل کلیک، استخراج آدرس های پست الکترونیک از وب سایت جهت ارسال نامه های هرز و حملات توزیع شده ی محروم سازی از سرویس، نمونه های شناخته شده ی...

ارائه یک الگوریتم بهبود یافته وب کاوی برای وب معنایی

این مقاله در حوزه داده کاوی و وب معنایی بوده و در آن روشی برای شخصی سازی صفحات وب براساس اصول داده کاوی و وب معنایی ارائه شده است. روش پیشنهادی، از لاگ مشاهده صفحات توسط کاربران به عنوان خوراک بخش داده کاوی، و از محتوای صفحات به عنوان ورودی واحد پردازش معنا استفاده می کند. نتایج حاصل از این دو فرآیند، با یکدیگر ترکیب شده و به عنوان صفحات پیشنهادی مدنظر کاربر، به او ارائه می شود. ایده استفاده از...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده صنایع

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023